HiPiler: Visual Exploration of Large Genome Interaction Matrices with Interactive Small Multiples

论文：HiPiler: Visual Exploration of Large Genome Interaction Matrices with Interactive Small Multiples

作者：Fritz Lekschas, Benjamin Bach, Peter Kerpedjiev, Nils Gehlenborg, and Hanspeter Pﬁster

发表：IEEE InfoVis 2017

简介

1）目标：辅助用户在巨大的矩阵（百万*百万级）中探索众多感兴趣的区域

2）挑战：

3）贡献 (HiPiler )：

4）数据：

1）对象：7 个博后+3 个研究生|四个生物学+六个算法

2）长期目标：更好地理解基因组对基因调控等过程的作用

3）可视化：- 用来探索，确认算法，展示结果并产生新想法

4）当前挑战：

5）任务：

T1:寻找已知图案
T2:发现新图案
T3:研究一个图案的实例
T4:比较同图案的实例
T5:将特征和图案实例相关联
T6:在矩阵中比较感兴趣的区域

1）问题：

2）界面：分为矩阵视图（左）和片段视图（右）。矩阵视图上方为整个矩阵的 overview，下方为细节展示，可放缩平移；片段视图可以交互地对片段进行排列、探索。

3）片段隐喻（T1, T2, T3, T5）：类别型属性用颜色再下方编码；有序型数据用边框的颜色和粗细编码

4）片段布局（T4）：分为一维、二维和多维三种。多维使用 T-SNE 方法降维得到布局。

5）片段聚类（T4, T6）：聚类后，每个片段每列取平均值划为一行的形式显示在上方，可以 hover 查看具体图案。集合封面可以显示集合的平均值或者方差。

6）视图关联（T5, T6）：

7）交互：系统提供三种交互创建集合：拖拽、lasso 以及扫选（视频中显示还可以通过设定粒度格来分组）。集合可以通过双击删除。

1）对象：计算生物学家*10

2）流程：

3）发现

该文章结合了矩阵和片段方法的优点，提供了全面、便捷的交互。

虽然数据特征比较明显，但是也可以代入地理数据等同样有固定排列顺序的数据。除此之外，其交互方法在观察高维数据时也有借鉴意义。

Questions & Discussion： ✉️ wangxumeng@zju.edu.cn